کاوش قوانین وابستگی در جریانات سریع داده

thesis
abstract

کشف قوانین وابستگی (association rule) یکی از پرکاربردترین الگوهاییاست که توسط داده کاوی استخراج می گردند و به معنای یافتن همه قوانین موجود در مشاهده اقلام مجمو عه های داده ای است.مهمترین فاز یافتن قوانین وابستگی، یافتن الگوهای پرتکرار می باشد. کشف قوانین وابستگی در جریان سریع داده ها با مشکلاتی روبروست. با توجه به ماهیت جریان داده ای، امکان ذخیره سازی داده های ورودی و مرور دوباره آنها وجود نداشته و می بایست به جای جواب های دقیق به دنبال جواب های نسبی باشیم که تا حد امکان به جواب های دقیق نزدیک باشند. به دلیل این محدودیت ها، به جای یافتن همه الگوهای پرتکرار به دنبال زیرمجموعه ای از آنها هستیم که در عین حال جزء جذاب ترین آنها نیز باشند.در این رساله نوع خاصی از الگوهای پرتکرار به نام الگوهای پرتکرار را معرفی نموده و الگوریتم جدیدی مبتنی بر پنجره کشویی برای کاوش آن معرفی می نماییم. این بخش جذاب ترین الگوها را از میان کلیه الگوهای پرتکرار انتخاب می نماید. برای رسیدن به این منطور از ساختمان داده ای پویا برای نگهداری نتایج ارزیابی در هر لحظه استفاده می گردد. از آنجایی که داده هایی که اخیرا مشاهده گردیده اند دارای اولویت بیشتری نسبت به داده های قدیمی می باشند از پنجره کشویی برای نگهداری این داده ها استفاده می گردد. جریان داده ورودی به پنجره هایی تقسیم می گردد. در واقع واحد عملیات به روز رسانی، پنجره می باشد. در این راستا از داده های مکمل داده ورودی برای رسیدن به هدف استفاده می گردد. استفاده از داده های مکمل پیپیدگی محاسباتی را کاهش خواهد داد. در نهایت روش پیشنهاد شده با استفاده از یک سری مجموعه های داده ای استاندارد مورد ارزیابی قرار گرفته و با سایر الگوریتم های ارائه شده در این زمینه مورد مقایسه قرار گرفته است. نتایج، بیانگر کیفیت روش معرفی شده در مقایسه با سایر روش ها از لحاظ زمان اجرا و همچنین کیفیت جواب های تولیدی می باشد.

First 15 pages

Signup for downloading 15 first pages

Already have an account?login

similar resources

توسعه فازی الگوریتم apriori برای کاوش قوانین وابستگی

در دنیای کنونی، اطلاعات به عنوان یکی از فاکتورهای تولیدی مهم مطرح است. در نتیجه، تلاش برای استخراج اطلاعات از داده ها از جمله چالش های اساسی در صنعت اطلاعات و حوزه های وابسته به آن است. حجم داده ها دائماً در حال رشد است و در همه ی محیط ها و به صورت متنوع در قالب های مختلف وجود دارد، که این نمایانگر پیچیدگی کار تبدیل داده ها به اطلاعات است. داده کاوی یکی از پیشرفت های اخیر در زمینه فناوری مدیریت ...

15 صفحه اول

بررسی وابستگی وقوع بیماری آسم آلرژیک با ویژگی های محیطی با استفاده از کاوش قوانین وابستگی مکانی فازی

آلرژی یکی از بیماری هایی است که به دلیل آلوده شدن محیط اطراف زندگی انسان به عوامل محرک آلرژی، در سالیان اخیر گسترش فزاینده ای داشته است. بهترین روش برای درمان بیماری آلرژی، شناسایی عامل آلرژی زا و سپس، دوری جستن از آن عامل است. در این میان، عوامل ناشناخته بسیاری هستند که می توانند موجب ایجاد آلرژی گردند که اغلب این عوامل از محیط زندگی افراد ناشی می شوند. این مقاله، به بررسی وابستگی میان وقوع نو...

full text

کاوش قوانین وابستگی فازی با حفظ حریم شخصی

داده کاوی با حفظ محرمانگی داده ها زمینه تحقیقاتی جدیدی در دو دهه اخیر می باشد. در حقیقت هدف اصلی الگوریتم های داده کاوی با حفظ محرمانگی تغییر داده های پایگاه داده ورودی به گونه ای است که داده های خصوصی و همچنین دانش های محرمانه، حتی پس از عملیات داده کاوی محرمانه بمانند. کاوش قوانین وابستگی با حفظ محرمانگی یکی از تکنیک های اصلی داده کاوی با حفظ محرمانگی به شمار می آید و هدف آن جلوگیری از استخرا...

بررسی وابستگی وقوع بیماری آسم آلرژیک با ویژگی های محیطی با استفاده از کاوش قوانین وابستگی مکانی فازی

آلرژی یکی از بیماری هایی است که به دلیل آلوده شدن محیط اطراف زندگی انسان به عوامل محرک آلرژی، در سالیان اخیر گسترش فزاینده ای داشته است. بهترین روش برای درمان بیماری آلرژی، شناسایی عامل آلرژی زا و سپس، دوری جستن از آن عامل است. در این میان، عوامل ناشناخته بسیاری هستند که می توانند موجب ایجاد آلرژی گردند که اغلب این عوامل از محیط زندگی افراد ناشی می شوند. این مقاله، به بررسی وابستگی میان وقوع نو...

full text

کاوش قوانین وابستگی زمانی مبتنی بر تقویم با استفاده از دوره های زمانی انعطاف پذیر

با پیشرفت های اخیر در فناوری اطلاعات و ذخیره سازی در کامپیوتر، مقدار داده ذخیره شده در پایگاه های داده فراتر از آن است که بتوان داده ها را بدون استفاده از شیوه های تحلیلی خودکار تحلیل کرد. علیرغم این که اطلاعات زیادی در این مجموعه داده‏ها نهفته است، این اطلاعات مستقیماً در اختیار کاربرها قرار ندارد. داده کاوی فرایندی است که در آن دانش نهفته در میان انبوهی از داده ها استخراج می گردد. دانش مفهومی ...

15 صفحه اول

بهبود کیفیت داده ها در کامل بودن داده با استفاده از قوانین وابستگی

در دنیای امروزی، فعالیت های سازمان ها و شرکت ها بیش از پیش بر اساس داده ها و اطلاعات حاصل از تحلیل آن ها است. بنابراین، کیفیت داده ها مسئله ی بسیار مهمی است، امّا معمولاً در مسائل داده کاوی و کشف دانش از پایگاه داده ها نادیده گرفته می شود و یا توجه زیادی به آن نمی شود. یکی از مهم ترین فاکتورهای کیفیت داده ها کامل بودن داده ها و مسئله ی داده های گمشده است. تاکنون تکنیک ها و روش های بسیار زیادی برا...

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


document type: thesis

وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده برق و کامپیوتر

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023